Le dataset utilisé ici est contsitué des données de vente d'un magasin de fashion ; Il contient environ 6,5M de lignes et 19 colonnes.(source: kaggle.com)
Pour la suite de mon analyse Je vais simuler une colonne age et age_bin pour enrichir nos données
Nous n'allons pas nous attarder ici sur l'analyse exploratoire car l'objectif principal est l'implémentation la segmentation RFM.
Dans ce dataframe chaque ligne correspond à un client unique (environ 1,3M clients) et les métriques de son comportement que nous allons exploiter pour scorer et segmenter de manière efficace.
Avec ce graphique nous pouvons déja identifier les profils les plus présents dans notre base client.